Logiciel d'aide à l'étiquetage morpho-syntaxique de textes de spécialité

نویسندگان

  • Ahmed Amrani
  • Jérôme Azé
  • Yves Kodratoff
چکیده

Résumé. La compréhension de textes de spécialité nécessite un étiquetage morpho-syntaxique de bonne qualité. Or, lorsque les textes étudiés sont issus de domaines spécifiques et peu usités, il est rare de disposer de dictionnaires et autres ressources lexicales fiables. Le logiciel que nous proposons permet d’utiliser un étiquetage réalisé par un étiqueteur généraliste, puis d’améliorer cet étiquetage en intégrant des connaissances d’experts du domaine étudié. Grâce au logiciel développé, il est relativement aisé pour un expert du domaine de détecter des erreurs d’étiquetage et de mettre en place des règles de ré-étiquetage. Ces règles peuvent être obtenues de deux manières différentes : (1) soit en utilisant un langage de programmation permettant d’exprimer des règles complexes de ré-étiquetage, (2) soit par apprentissage automatique des règles à partir d’exemples corrigés au moyen d’une interface dédiée. Cet apprentissage propose de nouvelles règles à l’expert, acquises automatiquement.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Extraction de termes centrée autour de l'expert

Résumé. Nous développons un logiciel, Exit, capable d’aider un expert à extraire des termes qu’il trouve pertinents dans des textes de spécialité. Tout est mis en place pour faciliter le travail de l’expert afin qu’il puisse consacrer son temps à la seule reconnaissance des termes pertinents. Pour cela, différentes mesures statistiques et de nombreuses options d’extraction sont disponibles dans...

متن کامل

L'alignement des documents médiévaux

RÉSUMÉ. Le but de l’alignement des textes est la mise en correspondance des sous-parties similaires de deux ou plusieurs traductions ou versions d’un même écrit. La plupart des méthodes utilisées dans la technique d’alignement reposent sur l’analyse statistique des fréquences de mots ou de caractères, ou sur la cooccurrence des chaînes que ceux-ci constituent. Afin d’en améliorer l’efficacité, ...

متن کامل

Pronoun Anaphora Resolution for Automatic Correction of Grammatical Errors (Correction automatique par résolution d'anaphores pronominales) [in French]

Résumé. Cet article décrit des travaux réalisés dans le cadre du développement du correcteur automatique d’un logiciel commercial d’aide à la rédaction du français. Nous voulons corriger des erreurs uniquement détectables lorsque l’antécédent de certains pronoms est connu. Nous décrivons un algorithme de résolution des anaphores pronominales intraet interphrastiques s’appuyant peu sur la corres...

متن کامل

Stratégies pour l'étiquetage et l'analyse syntaxique statistique de phénomènes difficiles en français : études de cas avec Talismane

RÉSUMÉ. Les outils statistiques robustes en TAL, tels que les étiqueteurs morphosyntaxiques et les analyseurs syntaxiques, utilisent souvent des descripteurs « pauvres », qui peuvent être appliqués facilement à n’importe quelle langue, mais ne prennent pas en compte les particularités de la langue. Dans cette étude, nous cherchons à améliorer l’analyse de deux phénomènes en français en injectan...

متن کامل

Les termes complexes dans les LSP: des processus de collaboration entre les unités textuelles et les unités terminologiques

Résumé : Notre projet concerne l’étude du comportement et de la linéarité des termes complexes (TC) en perspective contrastive français/italien, à l’intérieur des textes de spécialité. Notamment, notre objectif est de présenter comment les TC peuvent se modifier à l’intérieur des textes de spécialité et quels sont les raisons qui poussent à leur variation. Notre poster s'insère dans le cadre d'...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2005